Uso de Grafos de Conceptos para la Generación Automática de Resúmenes en Biomedicina

نویسندگان

  • Laura Plaza
  • Alberto Díaz
  • Pablo Gervás
چکیده

One of the main problems in research on automatic summarization is the inaccurate semantic interpretation of the source, which is reflected in the deficiencies shown by the resulting summaries. Using specific domain knowledge, as that supplied by ontologies, can considerably alleviate the problem. In this paper, we introduce an ontology-based extractive method for summarization. It is based on mapping the text to concepts in the ontology and representing the document as a scale-free graph. To assess the importance of the sentences we compute the centrality of their concepts in the text. We have applied our approach to summarize scientific biomedical literature, taking advantage from free resources as UMLS. Preliminary empirical results are presented and pending problems are identified.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Generación Automática de Casos de Uso para Desarrollo de Software Basado en Reutilización

Resumen. El desarrollo de software con reutilización se basa en la selección adecuada de elementos reutilizables del repositorio. La generación automática de casos de uso es una opción para acelerar la definición precisa de los requisitos funcionales como paso inicial para el desarrollo de software con reutilización. Por lo anterior, en este artículo proponemos un marco de trabajo para normaliz...

متن کامل

Comparación de técnicas metaheurísticas para la generación automática de casos de prueba que obtengan una cobertura de software

Resumen. La prueba del software es un proceso difícil y caro que consume normalmente el 50% de los costes en un desarrollo software. Por ello el uso de técnicas que permiten la automatización de este proceso es muy importante. Los últimos métodos para la generación automática de casos de prueba para la obtención de cobertura software utilizan la técnica metaheurística denominada Algoritmos Gené...

متن کامل

Una Propuesta para el Etiquetado Automático de Roles Semánticos

Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...

متن کامل

Los proyectos SINAMED e ISIS: Mejoras en el Acceso a la Información Biomédica mediante la integración de Generación de Resúmenes, Categorización Automática de Textos y Ontologías

Los sistemas inteligentes de acceso a la información están integrando de manera creciente técnicas de minería de texto y de análisis del contenido, y recursos semánticos como las ontologías. En los proyectos ISIS y SINAMED juegan un papel central la utilización de categorización de texto, la extracción automática de resúmenes y las ontologías, para la mejora del acceso a la información en un do...

متن کامل

Generación automática de objetivos de prueba a partir de casos de uso mediante partición de categorías y variables operacionales

Este trabajo complementa y amplia nuestros trabajos anteriores sobre generación de pruebas a partir de casos de uso presentando un proceso que, de manera sistemática y automática, permite generar objetivos de prueba a partir de casos de uso especificados en un lenguaje no formal. Este proceso aplica el método de categoría-partición y el patrón Use Case Test Pattern, el cual usa variables operac...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 41  شماره 

صفحات  -

تاریخ انتشار 2008